[新書] Algebra, Topology, Differential Calculus, and Optimization Theory for Computer Science and Machine Learning
作者 : Jean Gallier and Jocelyn Quaintance 網址 : https://www.cis.upenn.edu/~jean/gbooks/geomath.html
廢話
從自學資料科學以來,一直認為資料科學涵蓋的數學領域極為廣泛,若以目前台灣數學系所的課程規劃來看,若非一路念到數學研究所大概很難對於這些領域都有一個全盤的理解。
或許是我看得不夠多,目前坊間似乎也極少有針對電腦科學、資料科學的數學部分做一個統整性的課程或書籍,目前有看到的就屬中國雷鋒網上面出的一門課程 "机器学习必修之数学基础系列课程 " 看起來算是比較全面的課程。
的確,要出這樣一套課程或是書籍,不管在技術還是理念上都不算是一個很容易做到的事情,總還是希望能夠有這樣的東西出版,在我有限的能力範圍內盡可能地將數學在資料科學、機器學習或是深度學習中的運作做一個通盤的理解。
今天一早在 Reddit 上看到這本書的連結,點開一下,發現這本將近 2000 頁的書蠻符合我的期待 ( 但是不是真的有辦法嗑完又是另一個故事了..... ),如果以林軒田的課程來看,這本書也算是涵蓋的很全面了。( 不過也是有可惜的地方,就是差一個機率統計的部分,或許這不是作者的專長? )
本書架構
本書共分九個章節 (不含 Appendices) : * Linear Algebra 線性代數 * Affine and Projective Geometry 仿射變換與投影幾何 * The Geometry of Bilinear Forms 雙線性型中的幾何 * Algebra: PID’s, UFD’s, Noetherian Rings, Tensors,Modules over a PID, Normal Forms 抽象代數 * Topology, Differential Calculus 拓樸以及微積分 * Preliminaries for Optimization Theory 優化論 * Linear Optimization 線性優化 * NonLinear Optimization 非線性優化 * Applications to Machine Learning 機器學習上面的應用
整本書的內容會跟數學系用的教科書型態類似,以定義跟引理定理所構成,大略看了一下,內容都不算是太艱深,應該還算是一本易讀好懂的書。
我認為這本書還有一個很不錯的部分是在一些圖解上面做的也算是美觀且詳細
小結
我認為要踏進資料科學這一個領域,最終還是得面對數學。
我不認為對於資料科學所涵蓋的數學領域都必須要讀到通透,即使一個數學博士都不見得可以做到,但至少我們可以針對有觸及的部分稍微能夠有個粗略的概念跟理解,我想這也就足夠了。
雖然以台灣現在的教育體制下,數學已然成為讓人「聞風喪膽」的恐怖惡魔,但既然進了廚房也就不要再怕熱了,基礎數學還是得穩紮穩打,而這本書或許可以做為你我奠定基礎的一本好書。